# 提取英文字幕内容

import re

# 输入和输出文件名
input_file = 'English.txt'
output_file = 'output.txt'

# 从 input.txt 中读取文本
with open(input_file, 'r', encoding='utf-8') as file:
    text = file.read()

# 使用正则表达式提取英文内容
pattern = re.compile(r'\d+\n[0-9:, -->]+\n(.*?)(?=\n\d+|\Z)', re.DOTALL)
matches = pattern.findall(text)

# 将提取的内容保存到 output.txt 文档中
with open(output_file, 'w', encoding='utf-8') as file:
    for match in matches:
        file.write(match.strip() + '\n\n')  # 每段之间留一个空行

print(f"提取的内容已保存到 {output_file}。")
